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Avertissement 


Cet ouvrage est destiné aux étudiants de Licence, de première année des Grandes Écoles d’ingé- 
nieurs, de commerce et de gestion ou d’institut Universitaires de Technologie désireux d’appré- 
hender les concepts et les notions de base de la statistique. 

Il peut être utile à tous ceux qui seraient désireux d’acquérir ou de revoir les notions opérationnelles 
des méthodes de base de la statistique. 

Cet ouvrage comporte des rappels de cours sans démonstrations, des exercices classiques de 
difficultés progressives (le niveau de difficulté est repéré par un nombre d’étoiles), ainsi que des 
problèmes plus complexes permettant d’aborder des cas concrets d’utilisation de la statistique dans 
différents domaines d’application. Il est découpé en chapitres mais il comporte fondamentalement 
deux grandes parties : 

• Une première partie concerne le calcul des probabilités 

Bien que comportant des rappels de cours relativement complets, nous avons choisi, délibéré- 
ment, de ne proposer dans cette partie, que des exercices abordant des notions et des calculs de 
probabilité qui sont utilisés en statistique : Théorème Central-Limite (ou théorème de la limite 
centrale), Lois de probabilités fréquemment utilisées en statistique (Loi normale, du Khi-deux, 
de Student, de Fisher...) 

Nous avons donc évité de proposer des exercices de probabilités calculatoires classiques (exer- 
cices utilisant la combinatoire, calcul de paramètres de lois de probabilités...). 

Pour cette raison, avant d'aborder les chapitres de statistique, nous conseillons vivement au 
lecteur, de se reporter, en cas de besoin, aux ouvrages spécialisés, afin de revoir ou de compléter 
leurs connaissances en matière de calcul des probabilités. 

• Une deuxième partie est consacrée à l’étude des trois méthodes de base utilisées en statistique : 

— L’estimation ponctuelle 

— L’estimation par intervalle 

— Les tests d’hypothèse 

Les chapitres concernant l’estimation ponctuelle permette d’aborder les notions essentielles 
permettant d’étudier les estimateurs de paramètres réels de lois de probabilités. 

Néanmoins, ces chapitres proposent quelques exemples d’estimation de paramètres vectoriels. 
Les chapitres consacrés à l’estimation par intervalle proposent un éventail large d’exercices 
différents, permettant d’appréhender la plupart des cas concrets rencontrés dans les différents 
domaines utilisant la statistique. 

Les chapitres consacrés aux tests d’hypothèses sont essentiellement consacrés à l’étude des 
tests paramétriques dans le cas d’hypothèses simples et à l’étude de deux types de tests non 
paramétriques, les tests d’ajustement et les tests d’indépendance. 


Les différents chapitres proposent toujours la même organisation : les énoncés, puis une rubrique 
« Du mal à démarrer », et enfin, les corrigés des exercices proposés. 

Chaque corrigé propose, en outre, un bilan « ce qu’il faut retenir ». 
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RAPPEL DE COURS 

1.1 Rappels de Mathématiques 

a) Opérations sur les ensembles 

Soit a un ensemble et A, B ... des parties de fi. Si A désigne le complémentaire de A dans il, 
alors nous avons : 

• a uâ = a 

• AU B = Ân fi 

• A U B = (A n fi) U (A n B) U (Â n B) 

• A = U; (A n Bj) 

> si les évènements fi, sont incompatibles entre eux 

> et si a = U, fi, 

b) Analyse combinatoire 

Nous rappelions ici quelques résultats : 

• Nombre d’ arrangements de p objets pris parmi n avec répétition 

W n = n p 

• Nombre d’ arrangements de p objets pris parmi n sans répétition 

K = »(» - 1) • • • (n - p + 1) = — 

C n ~ fi)! 

• Nombre de combinaisons de p objets pris parmi n avec répétition 

K p = C p 

iv n ^n+p - 1 

• Nombre de combinaisons de p objets pris parmi n sans répétition 


p\(n-p)\ p\ 

• Nombre de permutations de n objets 


Per(n ) = n\ 



2 


1 • Probabilités 


1.2 Axiomes du calcul des probabilités 


a) Généralités 

La théorie des probabilités repose sur l’étude de phénomènes aléatoires. Une expérience est dite 
aléatoire si on ne peut pas prévoir son résultat et si répétée dans les mêmes conditions, elle peut 
donner des résultats différents. Les résultats possibles de cette expérience constituent l’ensemble 
fondamental fl. Un événement aléatoire est une assertion relative au résultat de l’expérience. 
On identifie usuellement l’événement aléatoire et la partie de fl pour laquelle cet événement est 
réalisé. 

Si P est une probabilité définie sur fl, et si A et B sont deux parties de fl, on a : 

• P(0) = 0 et P( fl) = 1 

• p(Â ) = 1 - P(A) 

• P(A U B) = P(A) + P(B) - P(A n B) 

P(A U B) = P(A) + P(B) si An B = 0 



b) Probabilités conditionnelles 


On définit la probabilité conditionnelle de l’événement A sachant que l’événement B est réalisé, 
par : 


P(A/B) = 


P{AnB) 
P (B) 


c) Formule de décomposition 

Si l’ensemble des parties U j de fl forme un système complet d’événements, c’est-à-dire si les Uj 
sont indépendants et si leur réunion forme fl tout entier, alors : 

n 

P{A) = Y, P(A/Uj)P(Uj ) 

7 = 1 


d) Indépendance de deux événements 

A et B indépendants P(A n B) = P(A)P{B) 


e) Probabilités des causes ou probabilités de BAYES 


P (A/ B) 


P{A n B) 
P(B ) 


P(B / A)P(A) 
~PÏB) 


Si l’ensemble des parties A, de fl forme un système complet d’événements, 


P(A k /B) 


P(B/A k )P(A k ) 
E/ P(B/ Ai)P(Ai) 
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1.3 Notion de variable aléatoire 

Lorsque l'ensemble fondamental il est tout ou partie de l'ensemble des réels R, le concept 
d’événement aléatoire est remplacé par celui de variable aléatoire. On distingue usuellement : 

1. les variables aléatoires discrètes pour lesquelles l’ensemble il est un ensemble discret de valeurs 
numériques (par exemple N ensemble des entiers naturels) 

2. les variables aléatoires continues pour lesquelles l’ensemble il est un intervalle de R ou R tout 
entier. 

a) Fonction de répartition 

On appelle « Fonction de répartition d’une variable aléatoire X » l’application F de R dans [0, 1] 
définie par : 

F(x) = P(X < x ) 


b) Variable aléatoire discrète 

> On définit la probabilité attachée en un point x du domaine de définition de la variable 
aléatoire X discrète par : 

P(X = x ) 


> Fonction de répartition de X : 

F(x ) = P(X <x) = Y^ p ( x = 0 

t<x 


c) Variable aléatoire continue 

> On dit que la variable aléatoire X de fonction de répartition F est continue si on peut définir 
une fonction densité de probabilité / de X vérifiant : 

/(x) = F\x) ou F(x) = / f(t)dt 

J — OO 


> La probabilité attachée au segment [a, b] est alors : 


P[a ^ X ^ b] = I f(x)dx = F {b) - F {a) 


d) Formule de changement de variables 

• Cas discret 

p Y = P(Y = y) = P(X G cp~\y)) 

© 


Y, p ( x=x ) 

xe<p~Hy) 
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• Cas continu 

> (p est monotone croissante 

G(y) = P (Y < y) = P(X < cp~\y)) = F [^“'(v)] 

> c p est monotone décroissante 

G(y) = P (Y <y) = P(X > tp~\y )) = 1 - P[X < cp~ l (y )] 


G(y) = 1 - F [^“'(y)] 


> (p n’est pas monotone 

G(y) = P (Y < y) = P(X G /,) + ••• + P(X G I n ) 
où , . . . , /„ sont les intervalles de la variable aléatoire X qui correspondent au domaine Y < y. 

e) Fonction caractéristique cp x 

• Cas discret _ 

<Px(t) = E ( e ' fX ) = ^exp (itx)P(X = x) 

Dx 

• Cas continu 

c p x {t ) = E ( e ' ,x ) = / exp (itx)f(x)dx 
Jd x 

• Exemples de fonctions caractéristiques : 

> Loi binomiale B (n, p) (p x (t) = (pe ir + l — p)" 

> Loi de Poisson P(À) <Px(0 = ex P [^( e " — 1)] 

> Loi de Gauss LG(m, <x) <p z (t) = e ltm x exp 

f) Fonctions génératrice G 

La fonction génératrice des moments de la variable X est définie par : 

G x (u) = E{e uX ) 

1.4 Moments d'une variable aléatoire 

a) Moment d'ordre r par rapport à l'origine 
> Calcul direct 

> variable discrète m r = E(X' ) = P(X = x,) 

x 

> vaiiable continue m r = E(X' )= / t r f(t)dt 

Jd x 
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>- Utilisation de la fonction caractéristique 


m n = E(X n ) = 


<P n x( 0) 
i n 


>• Utilisation de la fonction génératrice (pour les variables discrètes) 

E [X(X - 1) ... (X - n + 1)] = 0) 

où Gy 1 est la dérivée d’ordre n de la fonction génératrice. 


b) Moments centrés d'ordre r 

> variable discrète 

li r = E[{X- E[X]) r } = ~ E[X]) r P(X = Xi ) 

i 

> variable continue 

/r,. = E[{X- E[X]) r ] = [ (t - E[X]) r f(t)dt 

J D x 


c) Espérance mathématique 
>- Calcul direct 

> variable discrète 

E{X) = Y J XiP{X=x i ) 

x 

> variable continue 

E(X)= / tf(t)dt 

J D Xx 


> Espérance d'une somme 

E(X + Y) = E(X) + E(Y) 

>■ Utilisation de la fonction génératrice pour une variable aléatoire discrète 

E(X) = G x ( l) = J2 x P( x = x ) 

Dx 

> Utilisation de la fonction caractéristique 


ni\ = E(X) 

© 
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> Espérance mathématique de Y = <p(X) 

> Variable discrète 

E[cp(X)] = J2<P(x)P(X=x)) 

D 

> Variable absolument continue 


E[cp(X)\ = f (p(x)f(x)dx 
Jd x 


d) Variance 
> Calcul direct 

> Variable discrète 

PU = E [(Z - E[X]) 2 ] = - E[X]) 2 P(X = Xi) 

x 


t> Variable continue 

= E [(Z - E[X]) 2 } = [ (t - E[X]) 2 f(t)dt 
J D x 


> Formule développée de la variance 


V(X) = E{X 2 ) - [E(X)f = m 2 - m 2 

> Écart -type 

= s/V(Xj 

> Covariance de deux variables X et Y 

La covariance des deux variables Z et F est définie par : 

Cov (Z, Y) = E [(Z - E(X))(Y - E(Y))] 

> Variance d'une somme 

V(X + Y) = V(X) + V(Y) + 2Cov (Z, Y) 

> Inégalité de Bienaymé-Tchebichev 

Soit X une variable aléatoire de moyenne m et d’écart-type <t, alors pour tout t : 

1 

P(|Z — m\ > ta) ^ — 
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1.5 Variables à deux dimensions 

a) Définitions 
>- Variables discrètes 

> Probabilité en un point du domaine 

Pij = P(X = Xj, Y = yj ) 


> Fonction de répartition 

F(x, y) = P(X<x,Y < y) = P{X = l F Y = 

u<x v<y 


> Variables continues 
> Fonction de répartition 


F(x,y)= P(X <x,Y <y) 


f(x,y)dxdy 


> Densité de probabilité 


f(x,y) 


d 2 F(x , y) 
dxdy 


Dans ce qui suit, les formules sont données pour des variables continues. Les formules, pour les 
variables discrètes, s’en déduisent aisément. 


b) Lois marginales et lois conditionnelles 
> Loi marginale de X 

/ X / P+OO 

( / f(u,v)dv 

-oo \J — oo 

dF(x,.) r, 7 f + °° u w 

7 = /(*,•) = / f(x, v)dv 

dx J 

>• Loi marginale de F 

/ y / /•+<» 

( / f(u,v)du 

-oo \J — OO 




dF(., y) 
dy 


fi-, y) 


f(u,y)du 
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> Loi conditionnelle de Y/X 


F(y/X = x) = F{y/x) 


dF{x,y ) 
dx 

dF(x , .) 
dx 


fiy/x) 


dF{y/x) 

dy 


f(x,y) 
f(x, •) 


>- Loi conditionnelle de X/Y 


F{x/Y = y) = F{x/y) 


9F(x , y) 
dy 

dF(.,y ) 
dy 


fix/y ) = 

c) Espérance mathématique 
> Espérances des variables marginales 


dF(x/y) = f(x,y) 
dx f(.,y ) 


E(X) = 


xf(x, y)dxdy E(Y) = 


Dy 


yf(x.y)dxdy 


Dxy 


> Espérances des variables conditionnelles 

E(x/Y)= I xf(x/y)dx E(Y/X)= f yf(y/x)dy 

V Xy J Yjç 

On remarquera que ces espérances sont elles-mêmes des variables aléatoires. 
>- Théorème de l'espérance totale 

E(X) = E[E(X/Y)] E(Y) = E[E(Y/X )] 


d) Variance 

> Variances conditionnelles 

V(X/Y ) = E[X - E(X/Y)Ÿ V(Y/X ) = E[Y - E(Y/X)] 2 

> Théorème de la variance totale 


V(F) = V[E(Y/X)\ + E\V{Y/X)\ 



Dunod - La photocopie non autorisée est un délit 


Rappel de cours 


9 


e) Corrélation 
>- Coefficient de corrélation 

_ £[(X-g(X))(F-fi(F))] _ Cov(x,y) 
p VWrj x vW] e x cr y 


> Rapport de corrélation 


2 _ V[E(Y/X)] 

Vy/x V(Y) 


f) Matrice des variances-covariances 


M(X, Y) 


V(x) Cov(x,y) \ 
Co v(x,y) V(y) J 


1.6 Indépendance de deux variables aléatoires X et Y 

>- Définition 

Deux variables Z et F sont indépendantes si, quel que soit deux événements X G A et F G fi, 
on a : 

P(X G A , F G fi) = P(X G A) X P(Y G fi) 

>- Propriétés 

Deux vai'iables X et F sont indépendantes si et seulement si : 

> F(x,y) = F(x,.) x F(.,y) 

> f(x,y) = f(x,-)xf(.,y) 

> f(x/y) = f(x , .) f(y/x) = /(., y) 

> D(XJ) = P>X X P>Y 

> Variance de la somme 

Si les deux vai'iables X et F sont indépendantes alors, 

> E(XY) = E(X) x E(Y) 

> Cov (X, F) = 0 

> V (X + Y) = V(X) + V(Y) 

1.7 Probabilités individuelles 

a) Lois discrètes 

Le tableau ci-après rappelle la définition, l’espérance et la variance des six lois discrètes les plus 
© courantes 
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Loi 

Définition 

Espérance 

Variance 

Uniforme 

P(X =x)= - X e {1,2, , n} 
n 

71 + 1 

71“ — 1 

2 

12 

Bernoulli 

P(X =x)= p x (l- pÿ-* 16 ( 0 , 1 } 

p 

P( 1 - P) 

Pascal 

P(X = x) = p(l - pÿ~ x . 16 ( 1 , 2 ,...} 

i 

p 

q 
p 2 

Binomiale 

P(x = x) = c x n P x ( i - p)"~ x x e (o,i , ... 77 } 

np 

71/7(1 ~ />) 

Hyper-géométrique 

f-'t (~<n — t 

P (T ~ t) - Np N ~ Np 

v 7 fin 

t G {min(0, n — Np), . . . max(n, Np)} 

np 

N — n 

np( 1 — p) 

Al - 1 

Poisson 

m x 

P(X=x) = e ~ m — x £ (0,1, ... zi } 
x! 

m 

m 


b) Lois continues 

De même, le tableau ci-dessous rappelle les propriétés de quelques lois continues : 


Loi 

Définition 

Espérance 

Variance 

Uniforme sur [«, A] 

/(x) = -— ! — xe[a,fe] 
b — a 

b — a 
2 

(b - a) 2 
12 

Gauss LG(m,cr ) 

f(x) - 1 exp 

(x — m Ÿ 

x G] — oo, +oo[ 

m 

,r 2 

JW — n : — ex P 

d V 2 77 

la 1 

Exponentielle de 
paramètre A 

/(x) = Àexp(— Àx) x G [0, +oo[ 

i 

â 

1 

ri 

Gamma y(A, r) 

/(x) = 

T(r) 

r 

À 

r 

Â2 


1.8 Lois de la somme de variables indépendantes connues 

>- Binomiale 

B{n u p) + B{n 2 , p) = B(n i +n 2 ,p ) 

>- Poisson 

/’(A 1 ) + / , (A 2 ) = P(à i +A 2 ) 


Y j aiLG(m i ,* i ) = LG\Y J ajtni , 


7—1 


7 = 1 


\ 


E 

7=1 


? ? 

afcrf 


> Normales 
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ÉNONCÉS DES EXERCICES 


1.1 n étudiants sont soumis à un test d’aptitude. Pour coder ce test afin de le rendre anonyme, le 
responsable propose d’indiquer sur la fiche-test de chaque étudiant les quatre chiffres correspon- 
dant au jour et au mois de naissance de celui-ci. Quelle est la probabilité que deux étudiants aient 
le même code ? 


1 .2 Après une marée noire en Bretagne, l’organisme de protection des oiseaux de mer a évalué à 
20000 la population de sternes au large du Finistère. 500 d’entre eux ont été bagués. Un an après, 
on capture 100 sternes dans cette zone. Calculer la probabilité : 

QJ de ne pas avoir d’oiseau bagué ? 

Y£ d’avoir au moins deux sternes baguées ? 


1.3 Un dépistage systématique concernant un éventuel trouble de l’audition est effectué à la 
naissance. On sait que 2 % des nouveaux-nés présentent des troubles de l’audition. Ce dépistage 
commence par un test donnant 95 % de résultats positifs pour les nouveaux-nés atteints de ces 
troubles et 6 % de résultats positifs pour les bébés indemnes de ces troubles. 

[B Quelle est la probabilité qu’un nouveau-né pris au hasard soit atteint de ces troubles sachant 
que le test a donné un résultat positif? 

Y£ Quelle est la probabilité qu’un nouveau-né pris au hasard soit indemne de ces troubles 
sachant que le test a donné un résultat négatif ? 


1 .4 Dans une carrière de marbre, un contrôle est effectué sur des dalles destinées à la construction. 
La surface des dalles est vérifiée pour détecter d’éventuels éclats ou taches. Il a été constaté qu’en 
moyenne il ya 1 ,2 défaut par dalle et que le nombre de défauts par dalle suit une loi de Poisson. 

Quel est le paramètre de cette loi de Poisson ? Quelles sont les valeurs possibles de la 
variable ? 

YS Quelle est la probabilité d’observer plus de 2 défauts par dalle ? 

Q L’entreprise présente à ses clients deux catégories de dalles : celles présentant moins de 
deux défauts (qualité ***) et celles présentant au moins deux défauts (qualité **). Quelle est la 
probabilité d’observer au moins deux défauts sur une dalle ? Quelle est alors la proportion de 
dalles de qualité ** ? 

Q Sur 500 dalles contrôlées, quel est le nombre attendu ne présentant aucun défaut ? 
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1.5 * Une grande mutuelle d’assurances envisage d’éventuels changements de tarifs. Pour cela, 
elle a étudié le risque d'accident automobile de ses assurés en fonction de l'ancienneté de leur 
permis. Parmi ses assurés, il y a 20 % de jeunes ayant leur permis depuis moins de 5 ans et le 
risque d’accident de ces jeunes conducteurs est de 0,4. Le risque d’accident des assurés ayant leur 
permis depuis plus de 5 ans est de 0, 125. 

Si on choisit au hasard 10 jeunes conducteurs, quelle est la probabilité d’en voir au moins un 
ayant un accident dans l’année ? 

YS Même question avec 10 assurés ayant leur permis depuis plus de 5 ans. 

9 Si on prend au hasard 10 assurés, quelle est la probabilité d'en voir au moins un ayant un 
accident dans l’année ? 

1 .6 *Un fabricant d’ordinateurs portables souhaite vérifier que la période de garantie qu’il doit 
associer au disque dur correspond à un nombre pas trop important de retours de ce composant 
sous garantie. Des essais en laboratoire ont montré que la loi suivie par la durée de vie, en années, 
de ce composant est la loi exponentielle de moyenne 4. 

Q Préciser la fonction de répartition de cette loi ainsi que son espérance E(X) et son écart- 
type (T. 

Q Quelle est la probabilité qu’un disque dur fonctionne sans défaillance plus de quatre ans ? 

^ Quelle est la probabilité qu'un disque dur fonctionne sans défaillance six ans au moins, 
sachant qu’il a fonctionné déjà cinq ans. 

YS Quelle est la probabilité que la durée de vie appartienne à l’intervalle : [ E(X) — <r. E(X) + <x] ? 

Q Pendant combien de temps, 50 % des disques durs fonctionnent-ils sans défaillance ? 

9 Donner la période de garantie optimum pour remplacer moins de 15 % des disques durs sous 
garantie. 

1.7 On estime que 1 400 passagers ont réservé, le vendredi soir, sur le TGV Paris-Nantes de 
19h30. 

Les portes du train ouvrent une demi-heure avant le départ. 

Parmi les usagers, 50 arrivent avant l’ouverture des portes et 70 arrivent trop tard. 

On considère la variable aléatoire X, égale à la date d’arrivée d’un voyageur calculée par rapport 
à 19h30. (X = 0 à 19h30 et X est exprimé en minutes). 

YS En admettant que cette variable X suit une loi LG{m , cr), calculer m et a. 

YSi Déterminer l'heure à laquelle les portes du train doivent être ouvertes pour qu’il n’y ait pas 
plus de 20 usagers qui attendent sur le quai. 

YS Calculer le nombre de voyageurs ayant manqué le train si celui-ci accuse un retard de 
5 minutes. 
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1.8 Le modèle suivant peut être utilisé pour représenter le nombre de blessés dans les accidents 
de la circulation au cours d’un week-end. 

Le nombre d’accidents suit une loi de Poisson de paramètre A. 

Le nombre de blessés par accident, suit une loi de Poisson de paramètre /i. 

Le nombre total de blessés est donc : 

5 = Xi + X 2 + ■ • • + X N 

S est la somme d’un nombre aléatoire de variables de Poisson, indépendantes et de même loi. 

Donner une expression pour P (S = s). 

YM Calculer P (S = 0). 

ES Calculer E(S) et V(S). 


1 .9 Soit X une variable aléatoire suivant une loi de densité : 


/(*) = 


x e 


'TTX 


pour x > É) 


Soit Y une autre variable aléatoire. On suppose que la loi conditionnelle de Y sachant X est une 

? 1 

loi normale de paramètres m = 0 et a = — 

^2*X 


ES Calculer la loi du couple (F, X) 

YM Quelle est la loi conditionnelle de X sachant Y ? 
ES En déduire E [X/7] . 


ÉNONCÉS DES PROBLÈMES 


Problème 1.1 

Un avion long-courrier peut transporter 100 passagers et leurs bagages. Les 100 places ont été 
réservées. Il pèse 120 tonnes sans passager ni bagages, mais l’équipage compris et le plein de 
carburant effectué. Les consignes de sécurité interdisent au commandant de décoller si le poids de 
l’appareil chargé dépasse 129,49 tonnes. 

Le poids d’un passager suit une loi d’espérance mathématique 70 kg et d’écart-type 10 kg. 

Le poids de ses bagages suit une loi d’espérance mathématique 20 kg et d’écart-type 10 kg. 
Toutes ces variables aléatoires sont indépendantes. 

YM Calculer l’espérance mathématique et l'écart-type du poids total de l’appareil au moment du 
© décollage, tous les passagers et leurs bagages ayant été embarqués. 
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Y£ Le poids d’un voyageur et celui de ses bagages suivent des lois dont on ne connaît pas la 
nature. Par contre, l’espérance mathématique et la variance de chacune de ces lois ont les valeurs 
données précédemment. Calculer une limite supérieure de la probabilité pour que le commandant 
refuse d’embarquer une partie des bagages afin que le poids de l’appareil ne dépasse pas 129,42 
tonnes. 

9 On suppose en fait que le poids d’un voyageur suit une loi normale LG{ 70 ; 10) et celui des 
bagages suit une loi normale LG{ 20 ; 10). 

Calculer la probabilité pour que le commandant refuse d’embarquer une partie des bagages afin 
que le poids de l’appareil ne dépasse pas 129,42 tonnes. 

Expliquer la différence avec le résultat précédent. 

Problème 1.2 

On dispose de n variables aléatoires réelles (Xi, . . . , X n ) mutuellement indépendantes, de même 
loi, de fonction de répartition F de classe C 2 sur R. La densité de ces variables aléatoires est notée 
/■ 

Soit (Ei, ... , E„) la suite des X, ordonnées de façon croissante. 

Dans cet exercice, on s’intéresse à la loi du couple (E„, E[). 

La fonction de répartition du couple (E„, Ei) est définie par ( \Hx . y ) = P [ ( E„ ^ x) O (Ei ^ y)]. 

Q[ Calculer P\(Y n ^ x) O (Ei > y)] et en déduire la fonction de répartition $ du couple 
(K: E]). 

YS Déterminer la densité 0 du couple (E„ , Ei) en fonction de F et de /. 

Q Dans cette question, les variables X, suivent toutes des lois uniformes sur l’intervalle [0,1]. 

a) Établir les lois de E„ et de Ei et calculer leurs espérances mathématiques. 

b) Calculer E[(Y n - E,) 2 |. 

c) En déduire E(Y\Y n ). 

d) Calculer la covariance de E! et E„ ainsi que leur coefficient de corrélation linéaire r Y „ .y r 


DU MAL A DEMARRER 


B 


1 .1 II est plus simple, dans un premier temps, de chercher la probabilité de l’événement complé- 
mentaire. 

1 .2 La capture des oiseaux se faisant en globalité, on recherche un nombre de combinaisons sans 
répétition. 

1.3 Dans ce type d’exercice, il est essentiel de mettre en évidence les événements en présence. 

1 .4 De la valeur moyenne de la variable, on peut déduire la valeur du paramètre de la loi. 
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1 .5 Pour chacune des deux premières questions, on identifiera les paramètres de la loi suivie par la 
variable considérée. Dans la troisième question, la population totale des assurés est constituée du 
mélange des deux catégories étudiées ; il faut alors chercher la probabilité qu’un assuré quelconque 
ait un accident. 

1 .6 L’espérance de la loi exponentielle est l’inverse du paramètre. 

1 .7 Le nombre de passagers arrivés avant l’ouverture des portes et celui des passagers arrivés en 
retard permettent de calculer les paramètres de la loi. 

1 .8 La difficulté de l’exercice réside dans le fait que le nombre d’accidents, dans un week-end 
donné, est lui-même une réalisation d'une variable aléatoire. On est donc amené, dans un premier 
temps, à chercher une probabilité conditionnelle. 

1.9 La connaissance de la loi conditionnelle de Y sachant X et de la loi marginale de X nous 
permet de déterminer la loi du couple. 

Problème 1.1 

On détermine très facilement l’espérance du poids total T de l’appareil et l’indépendance des 
variables permet de déterminer aussi la variance de T . Dans la question 2, ne connaissant pas la loi 
des variables, on peut utiliser l’inégalité de Bienaymé-Tchebichev. En revanche, dans la question 
suivante, on peut déterminer la valeur exacte de la probabilité recherchée. 

Problème 1.1 

Il est essentiel de remarque que dans la série ordonnée, Y\ est le minimum et Y„ le maximum. 


CORRIGÉS DES EXERCICES 


1.1 II y a autant de codage possibles que de /z-uplcts formé des n jours anniversaires, c’est à 
dire 365". Un codage formé de nombres tous différents correspond à un arrangement de n dates 
anniversaires prises parmi 365, c’est-à-dire : A" 65 . La probabilité d’avoir n codages tous différents 
est donc : 

A" 

A 365 

365" 

La probabilité d’avoir au moins deux codages similaires est donc : 

P = 1 

Ainsi pour n = 30, on a déjà p = 0,7 


A n 

A 365 

365" 


Ce qu'il faut retenir de cet exercice 

Ce résultat surprend toujours car on le confond souvent avec la probabilité qu’un étudiant ait 
le même jour de naissance qu’une personne donnée. 
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1.2 Le nombre de dispositions que l’on peut faire en choisissant 100 sternes parmi 20000 est : 


Le calcul de ces probabilités est fastidieux. La population de ces oiseaux étant 


importante dans cette région, on peut considérer que chacun d'eux a la probabilité 
p = 500/20 000 = 1/40 d'être bagué. La probabilité de ne pas avoir de sterne baguée 
est alors : 


^ p = 0,7166 

Ce qu'il faut retenir de cet exercice 

La remarque suggère l’approximation de la loi hypergéométrique par la loi binomiale, approxi- 
mation justifiée par la petitesse du rapport entre la taille de l’échantillon et la taille de la 
population. 

1 .3 On va définir deux événements aléatoires : 

A : le nouveau-né est atteint d’un trouble de l’audition. P (A) = 0,02 

B : le test est positif. On ne connaît pas P(B) mais on connaît les deux probabilités conditionnelles 
suivantes : 


C 2 o ooo- Les oiseaux non bagués sont au nombre de 19 500 donc le nombre de combinaisons de 
100 sternes non baguées parmi 20000 est : Clç° 500 . 

Q La probabilité de ne pas avoir - d’oiseau bagué est alors le quotient : 



YS L a probabilité d’avoir exactement un oiseau bagué est (nombre de choix de l’oiseau 
bagué = 500 ) : 


C 20 000 

La probabilité d’avoir au moins deux sternes baguées est alors : 



P = 1 - Po ~ P î - 0,7174 





P(B/A) = 0,06 et P(B/A) = 0,95 
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On cherche la probabilité qu’un nouveau-né pris au hasard soit atteint de ces troubles sachant 


que le test a donné un résultat positif c’est-à-dire : P (A/ B). Pour cela, on utilise la formule de 
Bayes : 


YS De la même façon, la probabilité qu'un nouveau-né pris au hasard soit indemne de ces 
troubles sachant que le test a donné un résultat négatif est égale à : 


Ce qu'il faut retenir de cet exercice 

Ce type de raisonnement, très utilisé dans les travaux en Médecine, utilise la formule de Bayes 
pour trouver la probabilité conditionnelle recherchée. 

1 .4 [| Soit X la variable : « nombre de défauts par dalle ». La loi de X est une loi de Poisson. 
Son paramètre est égal à la moyenne observée sur l’échantillon : A = 1 ,2. Les valeurs possibles 
de X sont les entiers positifs. 

W P(X > 2) = 1 - P(X < 2). 

Or 


P(X = 0) = 0,301 , P(X = 1) = 0,361 , P(X = 2) = 0,217 
P(X > 2) = 1 - P(X sC 2) = 1 - 0,879 = 0,122 
^ La probabilité d’observer au moins deux défauts sur une dalle est alors : 

P(X > 2) =1 — P(X < 1) = 1 - e~ 1,2 - 1,2 x e- 1 ’ 2 = 0,338 
La proportion de dalles de qualité ** est donc 33,8 % : 

YS Sur les 500 dalles contrôlées, le nombre attendu ne présentant aucun défaut est : 

500 x P(X = 0) « 150 

Ce qu'il faut retenir de cet exercice 

La loi de Poisson caractérise fréquemment les événements rares. 


P(A/B) 


P{B/A ) x P(A) 
P(B) 


x P (A) _ P(B/A) x P (A) 


P(B / A)P(A) + P(B /A)P(A) 


P(A/B ) 


0,95 x 0,02 + 0,06 x 0,05 


P{X = 0) = e~ 1 ' 2 , P(X = 1) = 1,2 x e~‘’ 2 , P(X = 2) 
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1.5 9 Soit X la variable aléatoire : nombre de jeunes conducteurs accidentés parmi les 10 
choisis. Chacun de ces jeunes a une probabilité de 0,4 d’avoir un accident dans l’année et ceci 
indépendamment les uns des autres. La loi de la variable X est donc la loi binomiale de paramètres 
n = 10 et p = 0,4. 


=> P(X > 1) = 1 - P(X = 0) = 1 - 0,6 10 = 0,994 

YS En raisonnant de la même façon avec Y la variable aléatoire : nombre de conducteurs de 
plus de 5 ans de permis, accidentés, parmi les 10 choisis, cette variable suit une loi binomiale de 
paramètres n = 10 et p = 0,125. 

P (Y ^ 1) = 1 — P (Y = 0) = 1 - 0,875 10 = 0,737 

U Cette fois, on s’intéresse à la variable Z nombre d’assurés accidentés parmi 10 choisis au 
hasard dans la population des assurés. Il nous faut chercher la probabilité p * qu’un tel assuré ait 
un accident. Si on considère les événements : J : être jeune conducteur et A : avoir un accident 
dans l’année, on connaît les probabilités conditionnelles : 

P(A/J) = 0,4 , m/7) = 0,125 

ainsi que P(J) = 0,2. Le théorème des probabilités totales donne alors : 
p* = 0,2 x 0,4 + 0,8 x 0,125 = 0,18. On en déduit finalement : 

P(Z ^ 1) = 1 - P(Z = 0) = 1 - 0,82 10 = 0,86 


Ce qu'il faut retenir de cet exercice 

Dans la troisième question, on a un mélange de deux populations et le théorème des probabilités 
totales (ou formule de décomposition) permet de déterminer la probabilité d’accident. 


1 .6 2 La loi suivie par la durée de vie, en années, de ce composant est la loi exponentielle de 
moyenne 4. Sa densité est : 

f(x ) = 0,25<? -ü,25x pour x ^ 0 

La durée de vie moyenne est égale à 1 /0, 25 = 4 ans et son écart-type est cr = 4. La fonction de 
répartition est : 

F(x) = 0 si x < 0 

F(x) = f f(t)dt = 1 — e~°' 25x si x > 0 

J o 

ES P(X > 4) = 1 - F( 4) = exp(-l) = 0,368 
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U Par définition d’une probabilité conditionnelle : 

P(X > 6/X > 5) = P p ( * x > ^ = e- 0 ’ 25i6 ~ 5) = e~ 0 ’ 25 = 0,78 
Il s’agit d’un phénomène sans mémoire. 

EV P[E{X) - a < X < E(X) + a] = P(0 < X < 8) = F( 8) = 0,865 

Q On cherche la durée d durant laquelle 50 % des disques durs fonctionnent sans défaillance : 
P(X > d) = 1 — F(d) = 0,5. D’où exp(— 0,25r/) = 0,5. On obtient d = 2,77 ans. 

On cherche la durée t telle que : P(X < t) ^ 0,15. D’où : 

lnO,85 

P(X > t) = exp(— 0,25 0 = 0,85 =» t = — ~ Q, 61 


On pourra prendre une période de garantie de 7 mois. 

Ce qu'il faut retenir de cet exercice 

Le résultat de la troisième question est une caractéristique de la loi exponentielle. La probabilité 
que le matériel dure une année de plus ne dépend pas de l’instant initial. 


1 .7 H L’origine des heures d’arrivée est placée à 19h30. X est l’heure d’arrivée d’un voyageur 
comptée à partir de 19h30 et exprimée en minutes. 

Parmi l’ensemble des 1 400 passagers, X, variable statistique, représente l’heure d’arrivée des 
voyageurs, qui est décrite par sa distribution statistique. 

Si on tire un voyageur au hasard , X est la variable aléatoire « heure d’arrivée du voyageur », dont 
la loi-parente est la loi de description statistique précédente et dont les probabilités peuvent être 
calculées à partir des fréquences observées dans l’ensemble de la population. 

La variable aléatoire X suit la loi LG(m, a). Soit U la variable centrée réduite associée. On sait 
que 30 passagers arrivent une demi-heure avant le départ : 


P(X ^ -30) = P 


X — m —30 — m 

^ 


<x 


( T 


P(U SC Mo) 


50 

1400 


P(U sC M 0 ) = 1 - P(U sC -M 0 ) = 0,035 7 


P (U sC -M 0 ) = 0,964 3 


Dans la table de la loi normale centrée réduite, on lit : 


F(l, 81) = 0,9649 et F(l, 80) = 0,964 1 
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Par interpolation linéaire on a donc : 

-no - 1 ,80 0,964 3 - 0,964 1 0,000 2 1 

1,81 - 1,80 “ 0,964 9-0,9641 “ 0,000 8 “ 4 

30 + jti 

D’où : Mo = —1,803 et — Mo = 1,803 = 1 

( T 

Par ailleurs, 70 passagers arrivent trop tard : 


P(X ^ 0) = P 


X — m 


a 



= P 



70 

1400 


P (U > ui) = 1 - P (U < Mi) = 0,05 soit P(t/ < Ml ) = 0,95 
Dans la table de la loi normale centrée réduite on lit : 


F(l, 64) = 0,949 5 et F(l, 65) = 0,9505 

Par interpolation linéaire on a donc : 

m 

Mi = 1,645 = 

a 


On a donc le système : 


30 + m , „„„ m , , 

= 1,803 ; = 1,645 

cr a 


=>■ {m = —14,31 mn ; a = 8,70 mn} 
YS La variable aléatoire X suit la loi LG{— 14,31; 8,7) 

On doit déterminer a pour que : 


P(X < a) = F 


/X+ 14,31 ^ a + 14,31 \ 
V 8,7 ^ 8,7 J 


P(X ^a) = P [U 3 = 


a + 14,31 


20 


= 0,0143 


,7 J 1 400 
P(£7 sC m 3 ) = F({7 ^ — m 3 ) = 1 - F(F sC -m 3 ) = 0,014 3 
P(£7 sC — m 3 ) = 1 - 0,014 3 = 0,985 7 
Dans la table de la loi normale centrée réduite on lit : F(2, 19) = 0,985 7 
-14,31 — ci 


-m 3 = 


,7 


= 2,19 et a = — 33,36 mn = 33 mn et 20 s 


Il faut donc ouvrir les portes du train 33 minutes avant le départ. 
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U Soit n le nombre de personnes ayant manqué le train, parti avec 5 mn de retard : 


P(X > 5) = P(U ^ 2,217) 

P (U ^ 2,21) = 1 - P (U < 2,21) = 1 - F(2,21) = 1 - 0,9864 = 0,0136 
P (U > 2,22) = 1 - P(U < 2,22) = 1 - F( 2,22) = 1 - 0,986 8 = 0,013 2 
Par interpolation linéaire on a donc (en utilisant la taille LG{ 0, 1)) : 

p — 0,013 6 2,217 -2,21 0,007 7 


Il y aura donc, si le train accuse 5 minutes de retard, 19 personnes qui manqueront le train. 

Ce qu'il faut retenir de cet exercice 

Seule la loi normale centrée réduite est tabulée. Aussi, dès qu’on a une variable X suivant 
une loi normale de paramètres m et a, on introduit la variable centrée réduite associée : 


S est donc la somme d’un nombre aléatoire N de variables de Poisson, indépendantes, suivant 
© toutes la même loi. 



P(X > 5) = P 


X + 14,31 5 + 14,31 

1 ^ ! — 

8,7 8,7 


= P [U > 


19,31 


8,7 


0,013 2-0,013 6 2,22-2,21 0,01 10 


p = 0,013 32 et n = 1 400 x p = 18,648 



( T 


1.8 Soit N la variable aléatoire représentant le nombre d’accidents. La loi de N est la loi de 
Poisson de paramètre À. 

Soit X la variable aléatoire représentant le nombre de blessés par accidents. La loi de X est la loi 
de Poisson de paramètre p.. 

Soit S la variable aléatoire représentant le nombre total de blessés : 


N 
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IV Si on connaît le nombre d’accidents du week-end, on peut alors connaître le nombre de 
blessés dans le week-end en utilisant la somme de variables de Poisson : on va donc utiliser la loi 
de probabilité conditionnelle : 



e-^QwY e~ À A n 
5 ! n\ 



P(S = 0) = c“ À V — = exp[— A(1 - e-*)] 

n\ 


IV E(S ) = E[E(S/N)] 

E(S/N = n) = nfi => E(S/N) = Nfi 
E(S ) = E(Nfi) = fiE(N) = fiA 

V(S) = E[V(S/N)] + V[E(S/N)] 

E(S/N ) = Nfi et V(S/N) = N fi 

E[V(S/N)] = E(N fi) = fiE(N) = fiA 
V[E(S/N)] = V (N fi) = fi 2 V(N) = fi 2 A 

=> V(S) = fi\ + fi 2 \ = fi\{\ + fi) 

Ce qu'il faut retenir de cet exercice 

L’application des théorèmes de l’espérance totale et de la variance totale trouve ici tout son 


sens. 


1.9 |V Par définition, la densité conditionnelle de Y sachant X est égale à : 



On en déduit la loi du couple, pour x > 0 : 


f(y,x) 


X é~ x X 


y / 277'/2x 


/(w)=-xr^ 2) 

7 T 



